data("ACTG175")
dforigin = ACTG175
setdf = dforigin[dforigin$r == 1,]
# 현재 분포
table(setdf$race, setdf$treat)

# 목표 비율
target_ratio_treat0_r0 <- 0.6  # treat=0에서 race=0을 더 줄임
target_ratio_treat1_r0 <- 0.3  # treat=1에서 race=0을 추가로 줄임


setdf_t1_r0 <- setdf %>% filter(treat == 1, race == 0) %>% sample_frac(target_ratio_treat1_r0)  # treat=1에서 race=0 추가 감소
setdf_t1_r1 <- setdf %>% filter(treat == 1, race == 1)  # race=1은 유지

setdf_t0_r0 <- setdf %>% filter(treat == 0, race == 0) %>% sample_frac(target_ratio_treat0_r0)  # treat=0에서 race=0을 추가 감소
setdf_t0_r1 <- setdf %>% filter(treat == 0, race == 1)  # race=1은 이미 최대치 → 그대로 유지

setdf_balanced <- bind_rows(setdf_t0_r0, setdf_t0_r1, setdf_t1_r0, setdf_t1_r1)

table(setdf_balanced$race, setdf_balanced$treat)
setdf = setdf_balanced
A = setdf$treat
age = setdf$age
weight = setdf$wtkg
karnof = setdf$karnof
race = setdf$race
gender = setdf$gender
hemo = setdf$hemo
homo = setdf$homo
drugs = setdf$drugs
symptom = setdf$symptom
zprior = setdf$zprior
oprior = setdf$oprior
Y = setdf$cd496
preanti = setdf$preanti
str2 = setdf$str2
cd40 = setdf$cd40
cd820 = setdf$cd820
days = setdf$days
cens = setdf$cens


df = data.frame(F = race,
                X1 = hemo,
                X2 = homo,
                X3 = drugs,
                A = A,
                Y = Y) 

W = df[,c(2:4,1)]
